DQN 改进

DQN 改进

阅读延伸

Thrun 和 Schwartz，1993 年，《使用函数逼近进行强化学习存在的问题》（高估 Q 值）
van Hasselt et al.，2015 年，《双 Q 学习的深度强化学习》
Schaul et al.，2016 年，《优先经验回放》
Wang et al.，2015 年。《深度强化学习的对抗网络架构》。
Hausknecht 和 Stone，2015 年，《部分可观察 MDP 的深度递归 Q 学习》